智能论文笔记

DeepXDE: A deep learning library for solving differential equations

Lu Lu , Xuhui Meng , Zhiping Mao , George E. Karniadakis

分类：

2019-07-10

Deep learning has achieved remarkable success in diverse applications; however, its use in solving partial differential equations (PDEs) has emerged only recently. Here, we present an overview of physics-informed neural networks (PINNs), which embed a PDE into the loss of the neural network using automatic differentiation. The PINN algorithm is simple, and it can be applied to different types of PDEs, including integro-differential equations, fractional PDEs, and stochastic PDEs. Moreover, from the implementation point of view, PINNs solve inverse problems as easily as forward problems. We propose a new residual-based adaptive refinement (RAR) method to improve the training efficiency of PINNs. For pedagogical reasons, we compare the PINN algorithm to a standard finite element method. We also present a Python library for PINNs, DeepXDE, which is designed to serve both as an education tool to be used in the classroom as well as a research tool for solving problems in computational science and engineering. Specifically, DeepXDE can solve forward problems given initial and boundary conditions, as well as inverse problems given some extra measurements. DeepXDE supports complex-geometry domains based on the technique of constructive solid geometry, and enables the user code to be compact, resembling closely the mathematical formulation. We introduce the usage of DeepXDE and its customizability, and we also demonstrate the capability of PINNs and the user-friendliness of DeepXDE for five different examples. More broadly, DeepXDE contributes to the more rapid development of the emerging Scientific Machine Learning field.

translated by 谷歌翻译

Reliable extrapolation of deep neural operators informed by physics or sparse observations

Min Zhu , Handi Zhang , Anran Jiao , George Em Karniadakis , Lu Lu

分类：机器学习

2022-12-13

Deep neural operators can learn nonlinear mappings between infinite-dimensional function spaces via deep neural networks. As promising surrogate solvers of partial differential equations (PDEs) for real-time prediction, deep neural operators such as deep operator networks (DeepONets) provide a new simulation paradigm in science and engineering. Pure data-driven neural operators and deep learning models, in general, are usually limited to interpolation scenarios, where new predictions utilize inputs within the support of the training set. However, in the inference stage of real-world applications, the input may lie outside the support, i.e., extrapolation is required, which may result to large errors and unavoidable failure of deep learning models. Here, we address this challenge of extrapolation for deep neural operators. First, we systematically investigate the extrapolation behavior of DeepONets by quantifying the extrapolation complexity via the 2-Wasserstein distance between two function spaces and propose a new behavior of bias-variance trade-off for extrapolation with respect to model capacity. Subsequently, we develop a complete workflow, including extrapolation determination, and we propose five reliable learning methods that guarantee a safe prediction under extrapolation by requiring additional information -- the governing PDEs of the system or sparse new observations. The proposed methods are based on either fine-tuning a pre-trained DeepONet or multifidelity learning. We demonstrate the effectiveness of the proposed framework for various types of parametric PDEs. Our systematic comparisons provide practical guidelines for selecting a proper extrapolation method depending on the available information, desired accuracy, and required inference speed.

translated by 谷歌翻译

Ontologizing Health Systems Data at Scale: Making Translational Discovery a Reality

Tiffany J. Callahan , Adrianne L. Stefanski , Jordan M. Wyrwa , Chenjie Zeng , Anna Ostropolets , Juan M. Banda , William A. Baumgartner Jr. , Richard D. Boyce , Elena Casiraghi , Ben D. Coleman

分类：人工智能

2022-09-10

通用数据模型解决了标准化电子健康记录（EHR）数据的许多挑战，但无法将其集成深度表型所需的资源。开放的生物学和生物医学本体论（OBO）铸造本体论提供了可用于生物学知识的语义计算表示，并能够整合多种生物医学数据。但是，将EHR数据映射到OBO Foundry本体论需要大量的手动策展和域专业知识。我们介绍了一个框架，用于将观察性医学成果合作伙伴关系（OMOP）标准词汇介绍给OBO铸造本体。使用此框架，我们制作了92,367条条件，8,615种药物成分和10,673个测量结果的映射。域专家验证了映射准确性，并且在24家医院进行检查时，映射覆盖了99％的条件和药物成分和68％的测量结果。最后，我们证明OMOP2OBO映射可以帮助系统地识别可能受益于基因检测的未诊断罕见病患者。

translated by 谷歌翻译

How important are activation functions in regression and classification? A survey, performance comparison, and future directions

Ameya D. Jagtap , George Em Karniadakis

分类：机器学习

2022-09-06

受生物神经元的启发，激活功能在许多现实世界中常用的任何人工神经网络的学习过程中起着重要作用。文献中已经提出了各种激活功能，用于分类和回归任务。在这项工作中，我们调查了过去已经使用的激活功能以及当前的最新功能。特别是，我们介绍了多年来激活功能的各种发展以及这些激活功能的优势以及缺点或局限性。我们还讨论了经典（固定）激活功能，包括整流器单元和自适应激活功能。除了基于表征的激活函数的分类法外，还提出了基于应用的激活函数的分类法。为此，对MNIST，CIFAR-10和CIFAR-100等分类数据集进行了各种固定和自适应激活函数的系统比较。近年来，已经出现了一个具有物理信息的机器学习框架，以解决与科学计算有关的问题。为此，我们还讨论了在物理知识的机器学习框架中使用的激活功能的各种要求。此外，使用Tensorflow，Pytorch和Jax等各种机器学习库之间进行了不同的固定和自适应激活函数进行各种比较。

translated by 谷歌翻译

A Hybrid Iterative Numerical Transferable Solver (HINTS) for PDEs Based on Deep Operator Network and Relaxation Methods

Enrui Zhang , Adar Kahana , Eli Turkel , Rishikesh Ranade , Jay Pathak , George Em Karniadakis

分类：机器学习

2022-08-28

线性系统的迭代求解器是部分微分方程（PDE）的数值解的关键组件。过去几十年来一直进行了深入的研究，例如雅各比，高斯 - 塞德尔，共轭梯度，跨部方法及其更高级的变体，但仍有迫切需要开发更快，更强大和更可靠的求解器。基于操作员回归的科学深度学习的最新进展，我们提出了一种提示，即用于微分方程的混合，迭代，数值和可转移的求解器。提示结合了标准放松方法和深层操作员网络（DeepOnet）。与标准数值求解器相比，提示能够为宽类微分方程提供更快的解决方案，同时保留接近机器零的精度。通过本本征分析，我们发现提示中的单个求解器靶向本征谱系中的不同区域，从而导致均匀的收敛速率，从而使混合求解器的整体表现出色。此外，提示适用于多维方程，并且在计算域和可转移到不同离散化方面具有灵活性。

translated by 谷歌翻译

HTML版本

NeuralUQ: A comprehensive library for uncertainty quantification in neural differential equations and operators

Zongren Zou , Xuhui Meng , Apostolos F Psaros , George Em Karniadakis

分类：机器学习

2022-08-25

机器学习中的不确定性量化（UQ）目前正在引起越来越多的研究兴趣，这是由于深度神经网络在不同领域的快速部署，例如计算机视觉，自然语言处理以及对风险敏感应用程序中可靠的工具的需求。最近，还开发了各种机器学习模型，以解决科学计算领域的问题，并适用于计算科学和工程（CSE）。物理知识的神经网络和深层操作员网络是两个这样的模型，用于求解部分微分方程和学习操作员映射。在这方面，[45]中提供了专门针对科学机器学习（SCIML）模型量身定制的UQ方法的全面研究。然而，尽管具有理论上的优点，但这些方法的实施并不简单，尤其是在大规模的CSE应用程序中，阻碍了他们在研究和行业环境中的广泛采用。在本文中，我们提出了一个开源python图书馆（https://github.com/crunch-uq4mi），称为Neuraluq，并伴有教育教程，用于以方便且结构化的方式采用SCIML的UQ方法。该图书馆既专为教育和研究目的，都支持多种现代UQ方法和SCIML模型。它基于简洁的工作流程，并促进了用户的灵活就业和易于扩展。我们首先提出了神经脉的教程，随后在四个不同的示例中证明了其适用性和效率，涉及动态系统以及高维参数和时间依赖性PDE。

translated by 谷歌翻译

HTML版本

G2Φnet: Relating Genotype and Biomechanical Phenotype of Tissues with Deep Learning

Enrui Zhang , Bart Spronck , Jay D. Humphrey , George Em Karniadakis

分类：机器学习

2022-08-21

许多遗传突变会不利地影响承重软组织的结构和功能，临床后遗症通常导致残疾或死亡。遗传学和组织力学表征的平行进步为这些条件提供了重要的见解，但是仍然需要整合此类信息。我们提出了一种新型的基因型到生物力学 - 原型神经网络（G2 {\ phi}净），用于表征和分类软组织的生物力学特性，这些特性是组织健康或疾病的重要功能读数。我们通过推断涉及细胞外成分缺陷或缺陷的四种小鼠模型的非线性，依赖基因型依赖性的本构行为来说明我们的方法的实用性。我们表明，G2 {\ phi} net可以通过利用有限，嘈杂和非结构化的实验数据来正确归因于相关的基因型，同时归因于相关的基因型。更广泛地说，G2 {\ phi}网络提供了一种强大的方法和范式转移，用于定量地将基因型和生物力学表型相关联，并有望更好地理解它们在生物组织中的相互作用。

translated by 谷歌翻译

E Pluribus Unum Interpretable Convolutional Neural Networks

George Dimas , Eirini Cholopoulou , Dimitris K. Iakovidis

分类：计算机视觉 | 人工智能

2022-08-10

在高风险领域中采用卷积神经网络（CNN）模型受到了他们无法满足社会对决策透明度的需求的阻碍。到目前为止，已经出现了越来越多的方法来开发可通过设计解释的CNN模型。但是，这样的模型无法根据人类的看法提供解释，同时保持有能力的绩效。在本文中，我们通过实例化固有可解释的CNN模型的新颖的一般框架来应对这些挑战，该模型名为E pluribus unum unum Change Chandn（EPU-CNN）。 EPU-CNN模型由CNN子网络组成，每个工程都会收到表达感知特征的输入图像的不同表示，例如颜色或纹理。 EPU-CNN模型的输出由分类预测及其解释组成，其基于输入图像不同区域的感知特征的相对贡献。 EPU-CNN模型已在各种可公开可用的数据集以及贡献的基准数据集上进行了广泛的评估。医学数据集用于证明EPU-CNN在医学中对风险敏感的决策的适用性。实验结果表明，与其他CNN体系结构相比，EPU-CNN模型可以实现可比或更好的分类性能，同时提供人类可感知的解释。

translated by 谷歌翻译

Adaptive Gradient Methods at the Edge of Stability

Jeremy M. Cohen , Behrooz Ghorbani , Shankar Krishnan , Naman Agarwal , Sourabh Medapati , Michal Badura , Daniel Suo , David Cardoze , Zachary Nado , George E. Dahl

分类：机器学习

2022-07-29

关于自适应梯度方法等自适应梯度方法等训练动力的知之甚少。在本文中，我们阐明了这些算法在全批处理和足够大的批处理设置中的行为。具体而言，我们从经验上证明，在全批训练中，预处理的Hessian的最大特征值通常在某个数值下平衡 - 梯度下降算法的稳定性阈值。对于带有步长$ \ eta $和$ \ beta_1 = 0.9 $的Adam，此稳定性阈值为$ 38/\ eta $。在Minibatch培训期间发生了类似的影响，尤其是随着批处理大小的增长。然而，即使自适应方法在``稳定性的自适应边缘''（AEOS）上训练，但它们在该制度中的行为与EOS的非自适应方法的行为有很大不同。 EOS处的非自适应算法被阻止进入损失景观的高曲率区域，而AEOS的自适应梯度方法可以继续前进到高外观区域，同时适应预先调节器以补偿。我们的发现可以成为社区对深度学习中适应性梯度方法的未来理解的基础。

translated by 谷歌翻译

A Probabilistic Autoencoder for Type Ia Supernovae Spectral Time Series

George Stein , Uros Seljak , Vanessa Bohm , G. Aldering , P. Antilogus , C. Aragon , S. Bailey , C. Baltay , S. Bongard , K. Boone

分类：机器学习

2022-07-15

我们从一组稀疏的光谱时间序列中构建了一个物理参数化的概率自动编码器（PAE），以学习IA型超新星（SNE IA）的内在多样性。 PAE是一个两阶段的生成模型，由自动编码器（AE）组成，该模型在使用归一化流（NF）训练后概率地解释。我们证明，PAE学习了一个低维的潜在空间，该空间可捕获人口内存在的非线性特征范围，并且可以直接从数据直接从数据中准确地对整个波长和观察时间进行精确模拟SNE IA的光谱演化。通过引入相关性惩罚项和多阶段训练设置以及我们的物理参数化网络，我们表明可以在训练期间分离内在和外在的可变性模式，从而消除了需要进行额外标准化的其他模型。然后，我们在SNE IA的许多下游任务中使用PAE进行越来越精确的宇宙学分析，包括自动检测SN Outliers，与数据分布一致的样本的产生以及在存在噪音和不完整数据的情况下解决逆问题限制宇宙距离测量。我们发现，与以前的研究相一致的最佳固有模型参数数量似乎是三个，并表明我们可以用$ 0.091 \ pm 0.010 $ mag标准化SNE IA的测试样本，该样本对应于$ 0.074 \ pm。 0.010 $ mag如果删除了特殊的速度贡献。训练有素的模型和代码在\ href {https://github.com/georgestein/supaernova} {github.com/georgestein/supaernova}上发布

translated by 谷歌翻译